AI资讯新闻榜单内容搜索-Claude Son

微软Terminus-4B之后，Agent可能会进入「专用小模型Sub Agent」时代

您有没有想过：在代码Agent里，执行终端命令、跑测试、读报错、总结日志这种任务，用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行，是不是有点浪费？一定要这么做吗？

来自主题: AI技术研报

7752 点击 2026-05-14 10:01

GPT-5.6现身后，下一个Claude Sonnet 4.8又曝光了！

GPT-5.5发布没几天，后台日志里就冒出了GPT-5.6；Anthropic的一个从未见过的代号——Jupiter也炸出了！两天之内，两家巨头的下一代模型同时浮出水面。新一轮模型军备竞赛，比我们想的都要快！

来自主题: AI资讯

9920 点击 2026-05-02 13:37

我让 Claude 做「代购」，结果它给自己买了一堆乒乓球

可能还有些人记得，去年年底的时候，Anthropic 在自家办公室搞了一个自动售货项目，「主理人」是 Claude——哦不，主理机。当时是让 Claude Sonnet 3.7 在办公室里经营一台自动售货机，管进货、定价、跟同事聊天推销，干了大概一个月。结果

来自主题: AI资讯

7972 点击 2026-05-01 13:19

首个Qwen3.6开源模型来了！编程视觉双提升，还兼容OpenClaw

3B激活参数，视觉能力直逼Claude Sonnet 4.5。

来自主题: AI资讯

9084 点击 2026-04-17 10:07

Qwen3.6-Plus 深度测评报告

本报告基于XSCT Arena平台，对 Qwen3.6-Plus-Preview（阿里云，2026-04-02 发布）在文字能力（xsct-l）、网页生成（xsct-w）、Agentic 任务（xsct-a）三大场景下的表现进行系统评测，并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、

来自主题: AI产品测评

9549 点击 2026-04-04 16:19

Claude一夜拆掉AI编程天花板！百万token上下文登场，吞下整个代码库

粗大事了，刚刚，Claude把上下文窗口一口气撑到100万token！整套代码库、海量论文、长对话一次读完，AI真正拥有「超长工作记忆」。AI编程军备竞赛，正在被彻底改写。

来自主题: AI资讯

9017 点击 2026-03-14 14:01

OpenAI测谎13款大模型：Claude 3.7封神，GPT-5.2近乎失控！

OpenAI的最新研究揭示了一个反直觉的真相：越强大的推理模型，越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中，DeepSeek R1控制自身思维链的成功率仅为0.1%，Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯

9490 点击 2026-03-09 15:08

Claude最强Sonnet模型4.6来了，百万token上下文

这次是 Anthropic，率先发布了他们称之为「我们目前能力最强的 Sonnet 模型」Claude Sonnet 4.6。Claude 称，新模型对编码、计算机使用、长上下文推理、智能体规划、知识工作和设计进行了全面升级。

来自主题: AI资讯

9206 点击 2026-02-18 22:42

Claude Sonnet 4.6空降！Office性能干翻旗舰模型，软件股哀嚎一片

今日凌晨，Anthropic推出史上最强Sonnet模型——Claude Sonnet 4.6，新模型在编程、计算机使用、长上下文推理、Agent规划、知识工作和设计工作上全面进化。

来自主题: AI资讯

9974 点击 2026-02-18 11:44

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6756 点击 2026-02-12 15:32